郭磊 国防科学技术大学并行与分布计算重点实验室 长沙 410073唐玉华 国防科学技术大学并行与分布计算重点实验室 长沙 410073周杰 国防科学技术大学并行与分布计算重点实验室 长沙 410073董亚卓 中国人民解放军91655部队 北京 100036
摘 要:基于FPGA平台研究大规模矩阵Ch01esky分解的细粒度并行结构与实现.首先在数据依赖关系分析的基础上,提出了Cholesky分解细粒度并行算法,然后提出了可扩展的一维线性阵列结构实现该并行算法.最后在设计的开发板上实现了单精度浮点Cholesky分解阵列处理器.综合结果表明,单个Xilinx Virtex5 XC5VLX330FFl760 FPGA芯片可集成32个处理单元.与运行在2.50GHz Pentium微处理器上的串行C代码相比,该阵列处理器取得最大104.413倍和平均78.789倍的性能加速.
关键词:Cholesky分解;FPGA;细粒度并行;线性阵列处理器;单精浮点
中图分类号:TP302.2
馆藏号:h065039
所有评论仅代表网友意见